📉 Model Quantization - miterion · Scour

TinyML is the most impressive piece of software you can run on any ESP32

xda-developers.com·1d

⚡ONNX Runtime

Flag this post

Distributional Multi-objective Black-box Optimization for Diffusion-model Inference-time Multi-Target Generation

arxiv.org·1d

🏎️TensorRT

Flag this post

Quantized Differential Privacy via Learned Noise Injection & Adaptive Clipping (QDP-LAIC)

dev.to·9h·

Discuss: DEV

🏎️TensorRT

Flag this post

QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs

paperium.net·1d·

Discuss: DEV

Flag this post

A Beginner’s Guide to Getting Started with add_messages Reducer in LangGraph

langcasts.com·1d·

Discuss: DEV

🤖AI Coding Tools

Flag this post

Building a Rules Engine from First Principles

towardsdatascience.com·2d

Flag this post

My ML Learning Journey: From Confusion to Building a Working Model

kaggle.com·1d·

Discuss: DEV

🎓Model Distillation

Flag this post

VerfCNN, Optimal Complexity zkSNARK for Convolutional Neural Networks

eprint.iacr.org·2d

Flag this post

Part II : Building My First Large Language Model from Scratch

medium.com·7h·

Discuss: DEV

📊Gradient Accumulation

Flag this post

Text rendering and effects using GPU-computed distances

blog.pkh.me·2h·

Discuss: Lobsters, Hacker News

Flag this post

Fitting KNN: From Overfit to Underfit and Everything Between

dev.to·2d·

Discuss: DEV

🏎️TensorRT

Flag this post

Your Transformer is Secretly an EOT Solver

elonlit.com·1d·

Discuss: Hacker News

👁️Attention Optimization

Flag this post

Squeezing AI into Tiny Spaces: The Integer Revolution

dev.to·2d·

Discuss: DEV

🎯Tensor Cores

Flag this post

DeepSeek-OCR demonstrates the relevance of text-as-image compression: What does the future hold?

reddit.com·1d·

Discuss: r/LocalLLaMA

🎓Model Distillation

Flag this post

Evidence on language model consciousness

lesswrong.com·15h

🏎️TensorRT

Flag this post

Diagnosing layer sensitivity during post training quantization

dev.to·2d·

Discuss: DEV

🏎️TensorRT

Flag this post

Contribution-Guided Asymmetric Learning for Robust Multimodal Fusion under Imbalance and Noise

arxiv.org·1d

🏎️TensorRT

Flag this post

Convex Optimization (or Mathematical Programming) in Go

github.com·3h·

Discuss: r/golang

📜TorchScript

Flag this post

Beyond the Black Box: Making LLM Decoding Truly End-to-End

dev.to·1d·

Discuss: DEV

🎓Model Distillation

Flag this post

Scalable Knowledge Graph Embedding via Adaptive Dimensionality Reduction & Multi-Objective Optimization

dev.to·1d·

Discuss: DEV

🎓Model Distillation

Flag this post

Loading more...